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摘要 : 为 了 揭示 IncRNA 在 红 敬 凤梨 翌 合 叶片 形成 和 生长 发 育 过 程 中 的 调控 作用 机 制 ， 以 金 
边 红 苞 凤梨 为 材料 ,采用 Iso-seq 2005 测序 和 SMRT 三 代 全 长 转录 组 测序 联合 测序 分 析 技术 ， 


ay Wr ee He £L A IncRNA 信息 。 结 果 表 明 ， 鉴 定 得 到 6,018 条 IncRNA, BAT 3,298 个 基 


因 间 IncRNAs, 717 ARX IncRNAs, 890 个 内 含 子 IncRNAs 和 1,109 个 正义 IncRNAs, Zi 
据 量 较 二 代 测 序 有 了 极 大 的 提高 。 结 构 分 析 表 明 ， 红 苞 凤 梨 IncRNA 的 总 体 表 达 丰 度 低 于 


mRNA; 序列 长 度 在 400~1200 nt 区 间 比 例 高 于 mRNA， 而 在 >1600 nt 区 间 ，lncRNA 分 布 


的 比例 显著 小 于 mRNA; IncRNA 中 的 外 显 子 数量 总 体 少 于 mRNA,， 开放 阅读 框 长 度 总 体 上 
也 短 于 mRNA。 差 异 表达 分 析 表 明 ， 在 全 绿 、 全 白 叶 片 发 育 过 程 中 鉴定 到 1710 个 差异 表达 
IncRNA。 训 基因 预测 结果 表明 ，5441 个 IncRNAs 通过 Cis 作用 方式 预测 到 靶 基因 ，1544 个 
IncRNAs 通过 Trans 方式 预测 到 靶 基 因 。 驾 基因 的 功能 注释 和 富 集 分 析 显 示 ， 差 异 表 达 
IncRNA 的 刘 基 因 主 要 作为 酶 蛋白 参与 调节 叶片 代谢 活动 和 信号 转 导 等 方面 ， 与 叶片 的 颜色 
形成 、 光 合作 用 和 生长 发 育 密切 相关 。 该 文 鉴定 出 的 IncRNA 信息 以 及 对 其 结构 和 功能 的 分 
析 ， 为 红 苞 凤 梨 以 及 凤梨 科 其 它 植 物 的 ncRNA 表 观 遗传 调控 机 理 研究 提供 了 数据 基础 ， 筛 
选 出 的 差异 表达 IncRNA 在 金边 红 苟 凤梨 叶片 柑 合 性 状 的 形成 和 生长 发 育 中 具有 重要 的 调 
控 作用 。 
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Abstract: In order to reveal the regulation function of IncRNAs on the chimeric character 
formation and development of the leaf of Ananas comosus var. Bracteatus, Iso-seq 2005 
sequencing and SMRT full-length transcriptomesequencing were applyed to identify IncRNAs of 
Ananas comosus var. bracteatus. In this study, 6 018 IncRNAs were identified, containing 3 298 
intergenic IncRNAs, 717 antisense IncRNAs, 890 intron IncRNAs and 1 109 sense IncRNAs, 
which were greatly improved compared with Iso-seq 2005 sequencing. Structural analysis showed 
that the overall expression level of IncRNA was lower than that of mRNA. The transcript length 
distribution of IncRNA in the range of 400-1200 nt was higher than that of mRNA, while in the > 
1 600 nt, the proportion of IncRNA distribution was significantly lower than that of mRNA. The 
number of exons in IncRNA was generally less than that of mRNA, and the open reading frame 
was also shorter in length than that of mRNA. For analysis of differential expression, 1 710 
differentially expressed IncRNAs were identified during the development of complete green and 
complete white leaves. Target gene prediction results showed that 5 441 IncRNAs were predicted 
target genes by Cis action, and 1 544 IncRNAs were predicted target genes by Trans action. 
Functional annotation and enrichment analysis of target genes revealed that the target genes of 
differentially expressed IncRNAs mainly act on metabolic activities and signal transduction of 
leaves as enzyme proteins, and were closely related to leaf color formation, photosynthesis and 
leaf growth. The IncRNA information identified in this paper and, as well as the analysis of its 
structure and functions , provide a data basis for the study of the epigenetic regulation mechanism 
of IncRNA in Ananas comosus var. bracteatus and other plants in Bromelia. The identified 
differentially expressed IncRNAs play important roles in the chimeric character formation and 
development of leaf of Ananas comosus var. bracteatus. 
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红 苞 凤梨 (Ananas comosus var. bracteatus ) WRIT A ek A BK. FER BE HN A 39] 
长 ， 己 成 为 一 种 重要 的 新 型 观赏 植物 。 红 区 凤梨 自 交 不 杀 和 ,在 生产 中 以 吸 芽 进行 繁殖 ， 繁 
殖 系数 低 、 苗 木 整 齐 度 差 ， 限 制 了 红 苞 凤梨 的 规模 化 应 用 。 组 织 培养 能 快速 繁殖 红 苞 凤梨 ， 
但 繁殖 过 程 中 叶片 柑 合 性 状 不 稳定 ， 再 生 植 株 叶 片 常 失去 嵌 合 性 状 而 变 为 全 绿 植株 〈 曹 莉 ， 
2011) 。 细 胞 白化 突变 是 金边 散 合 叶片 形成 的 基础 ,研究 红 区 凤梨 叶片 细胞 白化 突变 的 分 子 
机 理 ， 对 于 揭示 红 区 凤梨 崔 合 性 状 的 形成 机 理 ， 提 高 符合 性 状 的 稳定 性 ,培育 新 的 嵌 合 性 状 
品种 具有 重要 的 理论 和 实践 意义 。 

本 课题 组 前 期 研究 结果 表明 , 红 苞 凤梨 白化 细胞 中 叶绿素 含量 极 显著 下 降 , 但 叶绿素 合 
成 代谢 的 结构 基因 表达 上 调 (Li et al.，2017; Xue etal., 2019) ， 说 明 转 录 后 调控 在 红 苞 凤 
梨 细 胞 白化 失 绿 、 金 边 租 合 性 状 形成 中 发 挥 了 重要 调控 作用 。LncRNA 具有 类 似 mRNA 的 


T 


A 结构 特征 ， 可 在 多 个 层面 调控 目标 基因 的 表达 。 可 作为 信号 分 子 、 诱 饵 分 子 、 引 导 分 子 以 及 
x 支架 分 子 ， 在 表 观 遗传 、 转 录 调 控 、 转 录 后 调控 等 多 个 水 平 发 挥 功能 (Zhang etal., 2018) 。 
= Hif, IncRNA 在 人 类 和 动物 中 研究 较为 广泛 ， 与 人 类 疾病 的 发 生 及 生物 体 的 生长 发 育 密切 
CD FAK (RES, 2015; JOHNSON, 2012; 王 艳 芳 等 ，2018)。 而 植物 IncRNA 的 研究 还 处 
= 于 起 步 阶段 .研究 结果 表明 IncRNA 在 植物 的 开花 诱导 (Csorba et al., 2014) EWR A (DING 
e etal., 2012) 、 逆 境 胁迫 〈Qin etal, 2017) 中 具有 重要 功能 ， 然 而 其 具体 的 作用 机 制 及 调 


节 功 能 等 尚 不 清楚 。 由 于 红 区 凤梨 没有 基因 组 数据 ， 且 Iso-seq 二 代 测 序 技术 读 长 较 短 ， 使 
得 红 苞 凤梨 非 编 码 RNA 的 挖掘 具有 一 定 的 局 限 性 。 随 着 测序 技术 的 发 展 ， 
SMRT(Single-molecule real-time) 三 代 测 序 技术 的 出 现 ， 因 其 无 需 进行 PCR 扩 增 ， 大 幅 降 低 
了 因 PCR 反应 引入 的 碱 基 错误 ， 操 作 更 为 简单 等 优点 ， 已 得 到 广泛 应 用 CFlusberg et al., 
20100 。 目 前 ，SMRT 三 代 测 序 技术 在 基因 组 、 甲 基 化 识别 、SNP 的 鉴定 、 基 因 重 测序 和 
转录 组 学 等 方面 的 优势 越 来 越 明显 (Smith etal., 2012; Guo etal., 2018; ) 。 此 外 ，SMRT 
测序 技术 得 到 几 千 KB 的 数据 ， 读 长 显著 增长 ， 大 大 减少 了 测序 后 的 Contig 数量 ， 使 得 基 
因 组 和 转录 组 的 组 装 得 到 极 大 改善 (English etal., 2012) 。 但 是 第 三 代 测 序 技术 也 存在 一 
定 的 缺点 ， 测 序 错误 率 普遍 偏 高 ， 测 序 产生 的 错误 率 可 高 达 15% (Koren etal., 2017) 。 所 
Dh, 采取 二 代 测 序 和 三 代 测 序 联合 分 析 已 成 为 当下 基因 组 研究 的 主要 方法 。 一 般 有 两 种 联合 
手段 , 可 以 选择 以 三 代 测 序 为 主 ,进行 组 装 ， 再 通过 二 代 测 序 得 到 的 高 质量 短片 段 对 三 代 的 
数据 进行 碱 基 纠 错 和 矫正 ; 也 可 以 选择 以 二 代 测 序 为 主 , 用 三 代 测序 得 到 的 长 片段 reads 进 
行 辅助 组 装 〈 马 建 超 ，2018) 。 最 为 通常 的 手段 是 利用 短 的 但 准确 度 高 的 二 代数 据 去 辅助 校 
正 长 的 但 准确 度 较 低 的 三 代数 据 ， 并 在 此 基础 上 进行 混合 组 装 。 经 验证 , 通过 这 种 混合 组 装 
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校正 方法 得 到 的 数据 准确 性 可 达 99% (BARU, 2018) 。 因 此 ， 这 种 “2 + 3 的 联合 模式 已 
被 广泛 认可 并 应 用 于 动物 、 植 物 和 微生物 的 基因 组 研究 Koren etal., 2012; Hackl et al., 
2014; IRESE, 2018) 。 

本 研究 以 红 苞 凤梨 为 材料 , 利用 三 代 和 三 代 测 序数 据 混合 组 装 校 正方 法 ,鉴定 红 敬 凤梨 
叶片 中 存在 的 IncPRNA， 分 析 在 全 绿 和 全 白 突变 叶片 生长 发 育 过 程 中 差异 表达 的 IncRNA 
通过 靶 基 因 的 功能 注释 和 富 集 分 析 , 揭示 IncRNA 在 红 苞 凤梨 叶片 细胞 失 绿 白化 及 生长 发 育 
过 程 中 的 作用 。 研 究 结果 为 红 光 凤梨 IncRNAs 表 观 遗传 调控 机 理 研究 提供 数据 基础 。 


1. 材料 与 方法 
1.1 试验 材料 

本 研究 以 金边 红 奋 凤梨 茎 段 为 外 植 体 ， 通 过 组 织 培养 获得 的 全 白 和 全 绿 植株 为 试验 材 
料 。 选 取 长 势 均 一 的 未 展 叶 期 、4~5 叶 期 和 10~12 叶 期 3 个 发 育 阶 段 的 全 绿 及 全 白 植株 各 
10 株 的 叶片 作为 样本 提取 RNA CALL) 。 样 本 取 下 后 立即 转 入 液 氮 速冻 ， 后 储存 于 -80C 用 
于 提取 RNA 进行 Iso-seqRNA2500 二 代 转 录 组 测序 。 


TE: A. 红 区 凤梨 野生 型 嵌 合 植株 ，B. 未 展 叶 的 全 白 芽 《〈《CW1) ; C. 未 展 叶 的 全 绿 芽 (CG1) ; D. 全 白 


4~5 Frit (CW2) ; E.A 4-5 Hit (CG2) ; F.A EE 10-12 HF CCW3) ; 


G. 全 白 苗 具 10-12 # (CG3) 。 标 尺 =1 em. 


Note: A. Ananas comosus var. Bracteatus wild-type chimeric plants; B. Un-leaved complete white buds (CW1); C. 
Un-leaved complete green buds (CG1); D. Complete white plantlets with 4~5 Leaf (CW2); E. Complete green 
plantlets with 4—5 leaves (CG2); F. Complete white plantlets with 10~12 leaves (CW3); G. Complete 
white plantlets with 10~12 pieces ( CG3). Ruler-1 cm. 


1 用 于 测序 的 红 苞 凤梨 全 绿 苗 和 全 白 苗 〈Xiong etal., 2018) 


Fig. 1 Different development stages of green and albino shoots of Ananas comosus var. bracteatus 


1.2 红 苞 凤梨 RNA 提取 及 二 代 Illumin Hiseq2500 测序 文库 构建 


1.2.1 ZUG PAR RNA 提取 及 检测 


取 -80C 冻 存 的 红 苞 凤梨 样品 ， 采 用 LABGENETM plant RNA Isolation kit 多 糖 多 酚 植物 


RNA 提取 试剂 盒 分 离 总 RNA, 操作 方 法 参考 使 用 说 明 。 高 质量 的 RNA 是 实验 成 功 的 基础 


为 保证 测序 的 准确 性 ， 对 样品 RNA 进行 了 检测 ， 分 别 采用 荧光 定量 仪 CQubit 2.0) 、 微 量 


分 光 光 度 计 (Nanodrop) 、 生 物 分 析 


X CAglient 2100) 、 电 泳 方法 检测 RNA 样品 的 纯度 、 


In 


浓度 、 完 整 性 和 是 否 有 基因 组 DNA 污染 等 ， 达 到 质 控 要 求 的 RNA 样品 用 于 后 续 试 验 。 


1.2.2 Illumina Hiseq2500 cDNA 文库 构建 及 上 机 测序 


利用 epicentre Ribo-ZeroTM 试剂 


BEA m P HI rRNA. VA rRNA-depleted RNA 为 模板 ， 


用 六 碱 基 随机 引物 (random hexamers) 合成 cDNA 第 一 条 链 和 第 二 条 链 。cDNA 纯化 后 进 


行 末端 修复 、 加 A 尾 并 连接 测序 接头 ， 然 后 用 AMPure XP beads 进行 片段 大 小 选择 。 降 解 


含 U 链 ， 通 过 PCR 富 集 得 到 cDNA 文库 。 文 库 构 建 后 ， 经 Qubit2.0 定量 ， Agilent 2100 tr 


测 文库 的 insert size 质量 ; 采用 QPCR 对 文库 的 浓度 〈 文 库 有 效 浓 度 >2nM ) 进行 准确 定量 ， 


完成 库 检 。 库 捡 完成 后 ， 采 用 Illumina Hiseq2500 平台 对 文库 进行 测序 。 


1.3 数据 质量 监控 
测序 所 得 reads 的 过 滤 与 1 


多 剪 是 保证 分 析 数据 可 靠 性 的 关键 ,结合 前 期 SMRT 测序 结果 


(MA etal., 2018) 进行 混合 组 装 校 正 后 ， 删 除 raw reads 中 包含 adapter. ploy-N 的 reads 


和 d£ 质量 的 reads 以 3k 得 clean reads 。 U 3€ 葛 Æ D 组 


( Acomosus 321 v3https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org Acomosus er 


) 为 参考 基因 组 ， 利 用 TopHat v2.0. 


用 Scripture (beta2) (LANGMEAD 


对 上 的 reads 进行 装配 获得 转录 本 。 


1.4 转录 本 表达 水 平和 编码 潜能 分 析 


9 (KIM etal., 2013) 软件 对 clean reads 进行 比 对 。 采 


etal., 2009) 和 Cuffiinks (v2.1.1) 软件 对 每 个 样品 比 


使 用 Cufflinks 软件 的 Cuffdiff 组 件 ， 对 转录 本 表达 水 平 进行 分 析 。 根 据 IncRNA 的 编码 


的 特点 进行 基本 筛选 选择 长 度 >200bp，Exon 个 数 >2 及 FPKM>0.1 的 转录 本 。 


因 IncRNA 不 编码 蛋白 ， 因 此 ， 通 过 对 基本 筛选 得 到 的 转录 本 进行 编码 潜能 得 选 ， 判 断 


NS 


其 是 否 上 共有 编码 潜能 ， 从 而 可 以 判定 


分 析 、CPAT 分 析 、pfam 蛋白 结构 域 


该 转录 本 是 否 为 ncRNA。 主 要 利用 CPC 分 析 、CNCI 


四 种 分 析 方 法 分 析 ncRNA 的 编码 能 力 。 去 掉 基 本 筛选 
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中 具有 潜在 编码 能 力 的 转录 本 ， 余 下 的 即 为 预测 的 mcRNA。 


通过 与 已 知 mRNA 进行 比较 ， 利 用 cuffcompare 分 析 结 果 中 的 class codes 对 得 


选 的 


E 


IncRNA 进行 分 类 。 


1.5 IncRNA 靶 基 因 预 测 及 功能 富 集 分 析 


基于 IncRNA 与 其 靶 基 因 的 作用 方式 〈cis 和 trans) ， 采 用 两 种 预测 方法 : 第 一 种 是 根 


据 IncRNA 与 mRNA 的 位 置 关 系 预测 ncRNA 的 靶 基 因 ， 即 IncRNA 100kb 范围 内 的 邻近 基 
为 其 对 基因 。 第 二 种 是 使 用 LncTar 靶 基 因 预 测 工 具 进 行 预测 ， 其 原理 是 利用 IncRNA 与 


mRNA 之 间 碱 基 互 补 配对 产生 的 作用 来 预测 。 


EH 


对 差异 表达 IncRNA 的 靶 基 因 利 用 KEGG(Kyoto Encyclopedia of Genesand Genomes), 


GO(Gene Ontology) 、 NR (NCBI non-redundant protein sequences) 、 COG (Clusters of 


Orthologous Groups of proteins) 4] Swiss-Prot 数据 库 进 行 功能 注释 和 富 集 分 析 ， 分 析 结 果 显 


HEH p 值 表示 。 


1.6 差异 表达 基因 分 析 
以 差异 倍数 (Fold Change) 22 且 错 误 发 现 率 FDR (False Discovery Rate) «0.05 作为 


差异 表达 的 和 划 选 标准 ， 使 用 EBseq 分 析 6 个 样本 间 差 异 表达 的 IncRNAs 及 mRNA. 


2. 结果 分 析 

2.1 测序 数据 与 参考 基因 组 比 对 效率 分 析 
长 链 非 编码 数据 利用 率 的 直接 体现 就 是 比 对 效率 , 即 Mapped Reads 占 Clean Reads 的 百 

分 比 。 经 SMRT 全 长 转录 组 数据 (NCBI 提交 号 PRJNA564223) (MA et al.，2018) 修正 后 ， 

6 个 样品 的 Reads 与 所 选 参考 基因 组 的 比 对 效率 为 67.74%~78.58% , 比 单独 使 用 Iso-seq 二 代 

测序 数据 的 比 对 效率 提高 了 约 5% CB, 20190 R1) 。 说 明 三 代数 据 的 修正 ， 有 效 提 

高 了 IncRNA 测序 数据 的 利用 效率 ， 有 利于 进一步 深入 挖掘 红 苞 凤梨 IncRNA 信息 。 


表 1 LncRNA 测序 数据 与 参考 基因 组 比 对 结果 统计 表 


< 


Wer 


Table 1 Statistical table of results comparing LncRNA sequencing data with reference genomes 


Multiple Mapped 
BMK-ID | Total Reads | Mapped Reads | Uniq Mapped Reads Reads Map to '+' Reads Map to '-' 
Reads 


CG1 79076522 | 55189580(69.79%) | 49512630(62.61%) 5676950(7.18%) 26221992(33.16%) | 26114494(33.02%) 


CG2 58211966 | 43212038(74.23%) | 38969713(66.94%) 4242325(7.29%) 20528366(35.26%) | 20406630(35.06%) 


CG3 59940624 | 47099978(78.58%) | 42724925(71.28%) 4375053(7.30%) 22401622(37.37%) | 22316850(37.23%) 


CWI 89205520 | 60424721(67.74%) | 54303433(60.87%) 6121288(6.86%) 28602353(32.06%) | 28571807(32.03%) 


CW2 73325390 | 54193072(73.91%) | 47988486(65.45%) 6204586(8.46%) 25479683(34.75%) | 25383354(34.62%) 


CW3 82021138 | 59631700(72.70%) | 53825598(65.62%) 5806102(7.08%) 28284423(34.48%) | 28381940(34.60%) 


组 上 的 Reads 数目 及 在 Clean 


一 < 
n 
pn 
> 


E: Total Reads: Clean Reads Zt H , 按 单 端 计 ; Mapped Reads: 比 对 到 参考 


a 
T 


Reads 中 占 的 百分比 ;， Uniq Mapped Reads: 比 对 到 参考 基因 组 唯一 位 置 的 Reads 数目 及 在 Clean Reads 4 


T 


的 百分比 ;Multiple Mapped Reads: 比 对 到 参考 基因 组 多 个 位 置 的 数目 及 在 Clean Reads 中 占 的 百分比 ; Reads 


F 


Map to ^: 比 对 到 参考 基因 组 正 链 的 Reads 数目 及 在 Clean Reads 中 占 的 百分比 。Reads Map to'': 比 对 到 


> 
zm 
T 


BEY 


组 负 链 的 Reads 数目 及 在 Clean Reads 4 


占 的 百分比 。 


Note: Total Reads: Number of Clean Reads, calculated on a single end;Mapped Reads: the number of Reads 
compared to the reference genome and the percentage of Clean Reads; Uniq Mapped Reads: The number of Reads 
compared to the unique location in the reference genome and the percentage of Clean Reads; Multiple Mapped 
Reads: The number of Reads compared to multiple locations in the reference genome and the percentage of Clean 
Reads;Reads Map to 't': The number of Reads compared to the positive strand in the reference genome and the 


' 


percentage of Clean Reads.Reads Map to '-': The number of Reads compared to the negative strand in the reference 


genome and the percentage of Clean Reads. 


22 红 区 凤梨 IncRNAs 的 鉴定 
对 测序 样品 cuffiinks 的 拼接 结果 第 一 步 经 过 cuffcompare 软件 分 析 合 并 ， 算 选 出 转录 本 
长 度 >=200bp， 外 显 子 个 数 >=2，FPKM > 0.1 的 转录 本 ,根据 已 知 mRNA 数据 库 ， 进 行 比较 


过 滤 mRNA， 然 后 通过 CNCI、CPC、CPAT 和 Pfam 四 个 软件 进行 蛋白 编码 潜能 筛选 ， 最 


终 鉴定 得 到 6,018 条 IncPRNAs， 其 中 新 IncRNAS689 条 (图 2) 。 比 利用 Iso-seq 二 代 测 序数 
据 鉴定 到 的 IncRNAs 数量 增加 了 约 70% CH, 20190 ， 极 大 地 提高 了 红 苞 凤梨 IncRNA 
的 数据 信息 量 ， 为 进一步 研究 红 苞 凤梨 的 非 编码 RNA 调控 机 理 提供 了 数据 基础 。 


鉴定 得 到 的 6,018 个 IncRNAs 中 ， 包 括 了 3,298 个 基因 间 IncRNAs (lincRNAS) ，717 


个 反 义 lncRNAS (antisense IncRNAs) ，890 个 内 含 子 IncRNAS Cintronic IncRNAs) 和 1,109 


个 正义 IncRNAs (sense IncRNAs) (图 3: B) 。 与 二 代 测 序 分 析 鉴 定 结果 相 比 ，lincRNA 
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所 在 比例 显著 提高 ， 由 17% 增 加 到 5596. ifj sense IncRNA 所 占 比 例 显著 下 降 ， 由 76% 下 降 


到 18.5% GHB, 2019) . 


3500 3298 
fam 


1109 


24 = Number 
8 


1000 em - 


lincRNA Antisense-IncRNA — Intronic-IncRNA sense-IncRNA 


基因 间 IncRNA 反 义 IncRNA ”内 含 子 IncRNA ”正义 IncRNA 


TE: A. 四 种 鉴定 方法 得 到 的 红 敬 凤梨 IncRNAs 数量 B. 红 区 凤梨 IncRNAs 不 同类 型 的 分 布 


Note: A. Number of IncRNA of Ananas comosus var. bracteatus obtained by four identification methods 
B. Distribution of different types of IncRNAs of Ananas comosus var. bracteatus 
图 2 IncRNA 的 鉴定 及 类 型 分 布 


Fig. 2 Identification and type distribution of IncRNA 


2.3 红 苞 凤梨 IncRNA 结构 分 析 

为 了 进一步 红 苞 凤梨 IncRNA 的 结构 特点 ， 将 IncRNA 与 蛋白 质 编码 RNA 在 整体 表达 
水 平 、 序 列 长 度 分 布 、 外 显 子 数目 分 布 以 及 开放 阅读 框 长 度 分布 情 况 进 行 了 比较 分 析 ( 图 3)。 
分 析 结 果 表 明 , 在 总 体 表达 水 平 上 , mRNA 的 表达 丰 度 高 于 IncRNA 的 表达 丰 度 (图 3: A). 
在 转录 本 的 长 度 分 布 上 ，IncRNA 在 400-1200 nt 区 间 分 布 比 例 高 于 mRNA (图 3: B), = 


代 测 序 结果 中 则 是 表现 在 400-600 nt 和 1400-1600 nt XÙ (IB, 2019) ; 而 在 转录 本 长 


度 >1600 nt 区 间 ，lncRNA 分 布 的 比例 显著 小 于 mRNA， 尤 其 在 >=3 000 nt KE (图 3: BO 。 


IncRNA 中 的 外 显 子 数 量 总 体 少 于 mRNA, 约 82% 的 ncRNA 只 含有 2 个 外 显 子 (图 3: C)。 


而 二 代 测 序 分 析 中 有 41.80% 的 IncRNAs 只 有 2 个 外 显 子 , 而 31.62% 的 mRNAs 的 外 显 子 


数 超过 5 个 〈 葡 了 珍 ，2019) . IncRNA 的 开放 阅读 框 长 度 总 体 上 也 短 于 mRNA。 约 99% 的 


IncRNA 开放 阅读 框 长 度 <=100 nt (图 3: D) ， 而 二 代 测 序 分 析 中 66% 的 IncRNAs 的 开放 
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阅读 框 在 0-100 nt ŻE (IB, 2019) 。 


i 
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百分比 Proportion (%) 


m 
o 


0 0 
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~ $ $ $ LP GC $ 
A $ $9 9 9 $9 u9 9 49 qq se we oe SSF ES Ss S 


~ 
外 显 子 数目 开放 阅读 框 长 度 
the number of exons the ORF length (nt) of transcript 


iE: A. IncRNA 和 mRNA 的 表达 水 平 比较 。B. IncRNA 和 mRNA 的 转录 本 长 度 分 布 比较 。C. IncRNA 和 
mRNA 外 显 子 数量 分 布 比较 。D.IncRNA 和 mRNA 的 ORF 长 度 分 布 比较 。 

Note: A. Comparison of the expression levels between IncRNAs and mRNAs. B. Comparison of transcript length 
distributions between IncRNA and mRNA. C. Comparison of the number of exons distributions between IncRNA 
and mRNA. D. Comparison of the ORF lengths distributions between IncRNA and mRNA. 

3 £L& UR. IncRNA 与 mRNA 的 比较 分 析 


Fig. 3 Comparative analysis of IncRNA and mRNA in Ananas comosus var. bracteatus 


2.4 红 苞 凤梨 IncRNAs 的 差异 表达 分 析 

以 Fold Change>2.0 H. FDR<0.05 作为 筛选 标准 ， 共 鉴定 得 到 了 1 710 个 差异 表达 的 
IncRNA。 对 算 选 出 的 差异 表达 IncRNA 进行 层次 聚 类 分 析 ， 聚 类 分 析 结 果 如 图 4:4 所 示 。 
在 未 展 叶 阶段 ， 全 绿叶 片 和 全 白 叶 片 中 ， 大 量 差异 表达 的 IncRNA 表达 丰 度 较 高 ， 在 全 白 苗 
和 全 绿 苗 的 发 育 到 4~5 EBENE, 多数 差异 表达 的 IncRNA 表达 水 平 下 降 。 而 全 白 苗 在 第 三 发 
育 阶 段 有 部 分 差异 表达 IncRNA 表达 水 平 显著 上 调 。 在 三 个 发 育 阶段 全 绿 全 白 叶 片 间 显著 差 
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异 表达 的 ncRNA 可 能 是 红 苞 凤梨 府 合 性 状 形成 的 关键 调控 因子 。 


CG1 CW1 CW3 CW2 CG2 CG3 


MA plot MA plot MA plot 


Ee A 
a AE Gal 
d 3 
ae 104 
了 
——————À 
T I—— x $ 3$ i 0 s 5 8$ i n 
log2(FPKM) log2(FPKM) log2(FPKM) 
Significant. Significant. Significant. 
+ IncANA up ragulatec 192 "IcANA_vp reguisted 216. » IncRNA up regulated 452 
^ eANA_cown regulated 284 * oRNA_down regulated: 181 » ncANA_cown reguiated: 142 
MRNA up regulated:856 mRNA. up regulated:1006 mRNA. up regulated-2152. 
* mRNA down regulated: 1244 v MRNA down regutated:1204 * mRNA down regulated: 1759. 
* unchange21488 > wr * wnchange:17206 
CG1 vs CW1 CG2 vs CW2 CG3 vs CW3 


VE: A. 差 异 表 达 IncRNA RAE. 图 中 颜色 代表 了 IncRNA 在 样品 中 的 表达 量 水 平 log2(FPKM+1)。 


Ds 


B. 差异 表达 IncRNA 和 mRNA 表达 量 的 MA 交互 式 图 。 差 异 表达 基因 MA 


中 每 一 个 点 代表 一 个 基因 。 


横 坐 标 为 两 样品 中 表达 量 均值 的 对 数值 ， 纵 坐标 为 两 样品 间 基 因 表 达 量 差异 倍数 的 对 数值 。 红 色 代 表 


上 调 hcRNA， 绿 色 代表 下 调 ncRNA, ERR EWEA, HERK FK, 


黑色 的 点 代表 表达 差异 不 显著 的 基因 。 

Note : A. Differentially expressed IncRNA clustering maps.The color in the figure represents the level of 
expression of IncRNA in the sample log2 (FPKM+1). B. MA interactive map of differentially expressed IncRNA 
and mRNA expression Each point in the MA map of the differentially expressed gene represents a gene. The 
abscissa is the logarithm of the mean value of the expression in the two samples; the ordinate is the logarithm of 
the difference in the gene expression between the two samples. Red represents up-regulation of IncRNA, green 
represents down-regulation of IncRNA, orange represents up-regulated genes, blue represents down-regulated 


genes, and black dots represent genes with insignificant differences in expression. 


4 差异 表达 IncRNA 分 析 。 
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Fig. 4 Differentially expressed IncRNA analysis 

同一 发 育 阶段 的 全 绿叶 片 与 全 白 叶 片 差异 表达 的 IncRNA 数量 和 mRNA 数量 如 图 4B 所 
示 。 在 未 展 叶 阶段 ， 差 异 表 达 IncRNA 共 476 个 ， 其 中 在 全 白 叶 片 中 上 调 表达 的 IncRNA192 
个 , 占 比 约 40%; 差异 表达 的 mRNA FE 3911 个 , 其 中 上 调 表达 的 mRNA2152 个 , 占 比 55%. 
在 4-5 叶 阶 段 ， 差 异 表 达 IncRNA 共 397 个 ， 其 中 在 全 白 叶 片 中 上 调 表达 的 IncRNA216 个 ， 
占 比 约 54%; 差异 表达 的 mRNA 共 2300 个 ,其 中 上 调 表达 的 1036 个 , iE EG 45%. 在 10~12 
片 叶 阶段 ， 差 异 表达 IncRNA d£ 594 个 ， 其 中 在 全 和 白 叶 片 中 上 调 表达 的 IncRNA452 个 ， 占 
比 约 76%; 差异 表达 的 mRNA FE 2100 个 ， 其 中 上 调 表达 的 856 个 ， 占 比 约 41%。 可 以 看 
出 ， 随 着 植株 的 生长 ，IncRNA 在 全 绿 植株 与 全 白 植株 间 的 差异 表达 越发 显著 ， 在 全 白 植株 
中 上 调 表达 的 ncRNA 显著 增加 ，IncRNA 的 差异 表达 可 能 在 绿 、 白 叶 色 的 差异 形成 过 程 中 
起 着 重要 的 调控 作用 。 而 这 个 过 程 中 ， 差 异 表达 的 mRNA 数量 在 减少 ， 上 调 表 达 的 基因 占 
比 也 在 减少 。 


2.5 红 敬 凤梨 LncRNA 靶 基 因 预 测 
LncRNA 调控 其 靶 基 因 的 方式 有 两 种 ， 分 为 Cis 作用 和 trans 作用 。 根 据 Cis 作用 , 我 们 


将 IncRNA 100kb 范围 内 的 邻近 蛋白 质 编码 基因 为 其 靶 基 因 , 经 过 分 析 预 测 ,5$441 个 IncRNAs 


通过 Cis 作用 方式 预测 到 靶 基 因 ， trans 作用 是 IncRNA 与 mRNA 由 于 碱 基 互补 配对 而 产生 


作用 ，LncTar (LI etal., 2015) 正 是 利用 LncRNA 和 mRNA 之 间 存 在 的 互补 配对 关系 进行 
预测 ， 通 过 计算 配对 位 点 自由 能 和 标准 化 自由 能 ， 标 准 化 自由 能 阔 值 以 下 的 则 认为 是 
LncRNA 的 靶 基 因 。1544 个 IncRNAs 通过 Trans 方式 预测 到 训 基 因 。 训 基因 的 预测 可 以 帮 


助理 解 ncRNA 的 功能 ， 揭 示 IncRNA 在 红 苞 凤梨 生长 发 育 过程 中 的 调控 作用 。 


2.6 红 苞 凤梨 差异 表达 IncRNA 靶 基 因 功 能 注释 和 富 集 分 析 


2.6.1 差异 表达 IncRNA 顺 式 靶 基 因 功 能 注释 和 富 集 分 析 


对 差异 表达 ncRNA WIRE AHT COG, GO 、KEGG、KOG、NR 和 Swiss-Prot 
功能 富 集 分 析 。 富 集 分 析 结 果 如 表 2 所 示 。 
表 2 注释 的 差异 表达 IncRNA 顺 式 靶 基因 数量 统计 表 


Table 2 Statstical of the number of cis-target genes of differentially expressed IncRNA 


组 别 注释 个 数 COG GO KEGG KOG NR Swiss-Prot 
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DEG Set Annotated 数据 库 数据 库 数据 库 数据 库 数据 库 数据 库 


CG1_vs_CWl 1878 721 219 719 131 1875 1298 
CG2 vs CW2 1667 632 093 657 013 1666 1179 
CG3 vs CW3 2263 885 525 925 394 2260 1619 
CGI vs CG2 1987 761 342 779 196 1985 1393 
CG1_vs_CG3 2283 861 542 899 350 2280 1596 
CWI vs CW2 2124 817 1421 845 1287 2123 1515 
CWI vs CW3 2284 854 1558 908 1376 2281 1635 
DEG Set Annotated COG GO KEGG KOG NR Swiss-Prot 
CG1_vs_CWl 1878 721 1219 719 1131 1875 1298 
CG2 vs CW2 1667 632 093 657 013 1666 1179 
CG3 vs CW3 2263 885 525 925 394 2260 1619 
CG1 vs CG2 1987 761 342 779 196 1985 1393 
CG1_vs_CG3 2283 861 542 899 350 2280 1596 
CW1_vs_CW2 2124 817 421 845 287 2123 1515 
CWI vs CW3 2284 854 1558 908 1376 2281 1635 
ik: COG 数据 库 : HAMA AREA (Clusters of Orthologous Groups) ; GO 数据 库 : 基因 本 体 (gene 


T 
>H 


ontology) ; KEGG 数据 库 : 京都 基因 与 基因 组 百科 全 书 (Kyoto Encyclopedia of Genes and Genomes) ; KOG 


数据 库 : 真 核 生 物 直 系 同 源 基因 艇 (Clusters of orthologous groups for eukaryotic complete genomes) ; NR 


数据 库 : JERE AJE (Non-Redundant Protein Sequence Database) ; Swiss-Prot 数据 库 : 含有 详细 注释 内 


容 的 的 蛋白 序列 库 。 


Note: COG: Clusters of Orthologous Groups; GO: gene ontology; KEGG: Kyoto Encyclopedia of Genes and 
Genomes; KOG: Clusters of orthologous groups for eukaryotic complete genomes; NR: Non-Redundant Protein 


Sequence Database; Swiss-Prot is a protein sequence database with detailed annotation content. 


是 一 个 结构 化 的 标准 生物 学 注释 系统 ， 在 GO 分 析 中 ， 基 因 注 


tr 


GO(gene ontology) Zit 4i 4 
释 在 三 个 层次 上 ， 即 : 生物 学 途径 (biological process) ， 分 子 功能 Cmolecular function) 和 


细胞 组 件 (cellular component) 。 从 图 5 可 以 看 出 ， 在 未 展 叶 阶段 ， 差 异 表达 IncRNA 的 部 


基因 主要 富 集 在 生物 学 途径 中 的 biological phases，rhythmic process 和 locomotion， 细 胞 组 


12 


202003.00073v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


件 方面 的 extracellular matrix 和 nucleoid， 分 子 功 能 方面 的 nutrient reservoir activity. protein 


binding transcription factor activity. guanyl-nucleotide exchange factor activity。 在 4~5 片 叶 阶 


段 ， 差 异 表 达 IncRNA 的 靶 基 因 主 要 富 集 在 细胞 组 件 的 nucleotide 和 分 子 功能 的 protein 


binding transcription factor activity, guanyl-nucleotide exchange factor activity 。 在 10~12 片 叶 


阶段 ， 差 异 表 达 IncRNA 的 诅 基 因 主 要 富 集 在 生物 学 途径 中 的 biological adhesion, rhythmic 
process 和 1locomotion, 分 子 功能 的 nutrient reservoir activity. protein binding transcription factor 


activity. guanyl-nucleotide exchange factor activity. 
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biological process 


ik: 横 坐 标 为 GO 425, Yl 


基因 背景 和 全 部 基因 背景 下 GO 各 二 级 功能 的 基因 富 集 情况 ， 


体现 两 个 背景 下 各 二 级 功能 的 地 位 ， 具 有 明 


标 左边 为 基因 数目 所 占 百 分 比 ， 右 边 为 基因 数目 。 此 图 展示 的 是 在 差异 表达 


13 


ChinaXiv 合 作 期 刊 


显 比 例 差异 的 二 级 功能 说 明 差 异 表达 基因 与 全 部 基因 的 富 集 趋 势 不 同 ， 可 以 重点 分 析 此 功能 是 否 与 差异 相 


关 。 

Note: The abscissa is the GO classification, the left side of the ordinate is the percentage of the number of genes, 
and the right side is the number of genes. This figure shows the enrichment of the secondary functions of GO in 
the background of differentially expressed genes and the background of all genes, reflecting the status of each 
secondary function in two contexts, and the secondary function with significant proportional differences indicates 
that the differentially expressed genes are different from the enrichment trend of all genes.it is important to analyze 


whether this function is related to differences. 


图 5 差异 表达 基因 GO 注释 分 类 统计 图 


Fig. 5 Differential expression gene GO annotation classification chart 


在 生物 体内 ,不同 的 基因 产物 相互 协调 以 执行 生物 学 功能 ,在 GO 分 析 基 础 上 ， 对 差异 
表达 IncRNA 反 式 靶 基 因 的 信号 通路 注释 分 析 能 够 进一步 解读 基因 的 功能 。 由 图 7 可 看 出 ， 
在 未 展 叶 期 , 全 绿叶 片 与 全 白 叶 片 间 的 差异 表达 IncRNA 的 靶 基 因 主 要 富 集 在 核糖 体 、 碳 代 
谢 、 氧 化 磷酸 化 、 淀 粉 和 糖 代 谢 、 氨 基 酸 代谢 、 脂 类 代谢 等 这 些 基础 代谢 和 植物 激素 信号 转 
录 通 路 上 。 同时 , 在 中 啉 和 叶绿素 代谢 途径 中 也 富 集 了 7 个 差异 表达 基因 ,在 4~5 片 叶 阶段 ， 
差异 表达 IncRNA 的 靶 基 因 主 要 富 集 在 矶 代谢 、 氧 化 磷酸 化 、 氨 基 酸 代谢 、 核 糖 体 这 些 基 础 
代谢 上 。 同 时 ， 也 富 集 在 植物 激素 信号 转 导 、 嗓 叭 代谢 、 内 质 网 蛋白 过 程 、RNA 降解 、 光 
合作 用 、 尝 粉 和 糖 代谢 方面 。 在 10-12 叶 阶 段 ， 差 异 表 达 IncRNA 的 部 基因 主要 富 集 在 核糖 
体 、 碳 代谢 、 氨 基 酸 代谢 、 氧 化 磷酸 化 、 内 质 网 重 白 过 程 、 嗓 叭 代谢 、RNA 降解 、RNA 转 
运 等 方面 , 在 中 啉 和 叶绿素 合成 代谢 途径 、 光 合作 用 途径 中 也 富 集 了 差异 表达 基因 。 与 二 代 
测序 结果 〈 菌 珍 ，2019) 对 比 发 现 ， 联 合 测序 分 析 增 加 的 靶 基 因 主 要 富 集 在 矶 代谢、 氨基 酸 
代谢 、 氧 化 磷酸 化 、RNA 降解 等 通路 上 。 差 异 表达 基因 的 富 集 结果 充分 说 明 IncRNA 参与 
了 红 苞 凤梨 叶片 色素 的 合成 、 光 合作 用 、 物 质 代谢 、 生 长 发 育 调控 等 生理 过 程 的 调控 。 
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ik: A. 未 展 叶 阶段 全 绿 全 白 叶 片 间 (CG1 vs CWIO 差异 表达 IncRNA 靶 基 因 KEGG 富 集 分 析 。 


B.4~5 片 叶 阶段 全 绿 全 白 叶 片 间 (CG2 vs CW2) 差异 表达 IncRNA 车 基因 KEGG 富 集 分 析 。 


C.10~12 片 叶 阶段 全 绿 全 白 叶 片 间 (CG3_vs_ CW3) 差异 表达 IncRNA HEIA KEGG 富 集 分 析 。 


Note: A. KEGG enrichment analysis of target genes of differentially expressed IncRNAs in the unexpanded leaf 


stage between complete green and complete white leaves (CG1_vs_CW1). B. KEGG enrichment analysis of target 


genes of differentially expressed IncRNAs in 4-5 leaf stage between complete green and complete white leaves 


(CG2 vs CW2). C. KEGG enrichment analysis of target genes of differentially expressed IncRNAs in 10-12 leaf 


stage between complete green and complete white leaves (CG3 vs CW3). 


图 6 差异 表达 IncRNA Jis 38 4E KEGG 分 类 图 


Fig. 6 Differentially expressed IncRNA cis-target gene KEGG Classification map 


2.6.2 差异 表达 IncRNA 反 式 靶 基因 功能 注释 和 富 集 分 析 


对 差异 表达 ncRNA X ERE] 


进行 COG. GO 、KEGG、KOG、NR 和 Swiss-Prot 功 


能 富 集 分 析 。 富 集 分 析 结 果 如 表 3 所 示 。 


表 3 注释 的 差异 表达 IncRNA 反 式 靶 基 因数 量 统计 表 


Tab3 Statistical table of the number of trans-target genes of Annotated differentially expressed 


IncRNA 
组 别 注释 个 数 COG GO KEGG KOG NR Swiss-Prot 
DEG Set Annotated 数据 库 HUE 数据 库 数据 库 数据 库 数据 库 
CGl vs CWI 14 7 9 4 6 14 5 
CG2 vs CW2 29 7 20 8 14 29 14 
CG3_vs_CW3 29 7 19 2 16 29 10 
CG1_vs_CG2 16 7 11 3 6 16 7 
CG1_vs_CG3 24 8 15 5 8 24 8 
CWI vs CW2 13 2 8 4 5 13 8 
CWI vs CW3 22 5 14 1 11 22 12 
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DEG Set Annotated COG GO KEGG KOG NR Swiss-Prot 
CGI vs CWl 14 7 9 4 6 14 5 
CG2_vs_CW2 29 7 20 8 14 29 14 
CG3_vs_CW3 29 E 19 2 16 29 10 
CG1_vs_CG2 16 7 11 E 6 16 T 
CG1_vs_CG3 24 8 15 3 8 24 8 
CWI] vs CW2 13 2 8 4 5 13 8 
一 
CW1_ vs CW3 22 5 14 1 11 22 12 


T 
> 


ik: COG 数据 库 : ŒE AJM ELA Fn] i 


ff (Clusters of Orthologous Groups) ; GO 数据 库 : 基因 本 体 (gene 


>H 


ontology) ; KEGG 数据 库 : 京都 基因 与 基因 组 百科 全 书 (Kyoto Encyclopedia of Genes and Genomes) ; KOG 


数据 库 : 真 核 生 物 直 系 同 源 完整 基因 簇 (Clusters of orthologous groups for eukaryotic complete genomes) ; 


NR 数据 库 : 非 元 余 和 蛋白 库 CNon-Redundant Protein Sequence Database) ; Swiss-Prot 数据 库 : 含有 详细 注 


释 内 容 的 的 蛋白 序列 库 。 


Note: COG: Clusters of Orthologous Groups; GO: gene ontology; KEGG: Kyoto Encyclopedia of Genes and 


Genomes; KOG: Clusters of orthologous groups for eukaryotic complete genomes; NR: Non-Redundant Protein 


Sequence Database; Swiss-Prot is a protein sequence database with detailed annotation content. 


功能 注释 和 富 集 分 析 结 果 表 明 , 差异 表达 IncRNA 反 式 靶 基 因 功 能 注释 到 的 基因 数量 不 
多 ,在 叶片 发 育 过 程 中 ， 全 绿 、 全 和 白 叶 片 间 差异 表达 IncRNA 顺 式 靶 基因 主要 富 集 在 核糖 体 、 
碳 代谢 、 氨 基 酸 的 生物 合成 、 氧 化 磷酸 化 、 内 质 网 中 的 蛋白 质 加 工 以 及 演 粉 与 蔗糖 代谢 等 方 
面 ; 而 差异 表达 IncRNA 反 式 靶 基 因 主 要 富 集 在 TCA 循环 、 淀 粉 和 糖 代谢 、 氨 基 糖 和 核糖 
代谢 、RNA 降解 、 氨 基 酸 代谢 等 方面 。 两 类 IncRNA 在 不 同 的 生理 代谢 过 程 中 发 挥 着 调控 
作用 。 


3. 讨论 
植物 叶 色 蔡 合体 嵌 合 性 状 明显 ， 嵌 合 方式 多 样 且 易于 观察 ,是 研究 植物 生长 发 育 以 及 遗 
传 育种 的 优良 材料 。 对 植物 叶 色 嵌 合 体 的 研究 ， 己 经 成 为 陪 合 体 研究 的 重要 方向 , 深入 研究 
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植物 檬 合体 形成 机 理 , 对 于 植物 生长 发 育 过 程 中 细胞 间 的 相互 作用 、 植物 嵌 合 性 状 稳定 繁殖 
以 及 植物 遗传 育种 具有 十 分 重要 的 意义 。 红 苞 凤 梨 叶 花 果 具 有 艳丽 的 颜色 , 是 重要 的 新 型 观 
赏 植物 ,是 研究 叶 色 镶嵌 形成 机 理 的 理想 材料 。 叶肉 细胞 的 白化 突变 是 金边 嵌 合 叶 色 形 成 的 
基础 和 关键 环节 ， 是 多 基因 协同 作用 的 结果 。 扎 合 性 状 的 形成 与 稳定 ， 与 基因 表达 的 有 序 调 
控 是 密切 相关 的 。 前 期 研究 表明 ,转录 后 调控 在 红 苞 凤梨 金边 嵌 合 性 状 形 成 过 程 中 具有 重要 
作用 ， 而 IncRNA 可 在 表 观 遗传 调控 、 转 录 调 控 、 转 录 后 调控 等 水 平 发 挥 功 能 ， 构 建 红 苞 凤 
对 于 天 清 红 苞 凤梨 金边 嵌 合 性 状 形成 机 理 具 有 
重要 意义 。 由 于 红 敬 凤梨 基因 组 信息 的 缺乏 ，IncRNA 的 鉴定 分 析 以 二 代 转 录 组 测序 数据 为 
基础 ， 以 菠萝 基因 组 作为 参考 基因 组 进行 分 析 。 红 区 凤梨 与 菠萝 为 同属 同 种 不 同 变种 植物 ， 
亲缘 关系 很 近 (LEAL&COPPENS，2003) ， 采 用 菠 葛 基因 组 数据 作为 参考 基因 组 能 有 效 鉴 
rE ZL AGAR AY ImcRNA， 为 红 苞 凤梨 的 表 观 遗传 调控 研究 提供 基础 数据 。 而 二 代 测 序 技术 由 


于 其 读 长 得， 不 能 提供 完整 的 转录 本 (KOREN etal., 2012) ， 很 难 正 确 预测 基因 的 结构 


mS 
E 


= 


AY IncRNA 表达 谱 ， 揭 示 IncRNA 的 调控 机 第 


(COGHLAN et al., 2008) 。SMRT 全 长 转录 组 测序 克服 了 二 代 测 序 读 长 短 的 缺点 ， 是 研究 


基因 结构 、 基 因 功 能 和 比较 基因 组 学 的 基本 方法 (LUO etal., 2017; SHARON et al., 2013). 
本 研究 采用 SMRT 全 长 转录 组 测序 数据 和 二 代 测 序数 据 混合 组 装 人 
以 提高 IncRNA 分 析 的 准确 性 。 

经 混合 组 装 校正 后 的 clean reads 比 对 到 菠萝 参考 基因 组 , 比 对 效率 达到 67.74%~78.58% 
比 二 代数 据 分 析 提 高 了 约 5%， 有 效 地 提高 了 长 链 非 编码 数据 的 利用 率 《〈 获 珍 ，2019) 。 经 
CPC 分 析 、CNCI 分 析 、CPAT 分 析 、pfam 和 蛋白 结构 域 分 析 ， 共 鉴定 得 到 6，018 个 IncRNA, 
比 之 前 鉴定 得 到 的 ncRNA 数量 提高 了 约 70%， 极 大 地 丰富 了 红 苞 凤梨 IncRNA 数据 库 ， 为 


红 苞 凤梨 表 观 遗传 调控 的 研究 提供 了 基础 数据 。 在 鉴定 得 到 的 6018 个 IncRNA 中 ， 最 多 的 


& IE JS BET IncRNA 分 析 ， 


es 


是 lincPRNA， 占 比 约 55%， 比 之 前 结果 提高 了 约 2 倍 。 而 sense ncRNA 的 数量 极 显著 下 降 ， 


由 之 前 的 75% 下 降 到 18.5% CHB, 2019) 。 本 次 分 析 结果 中 4 种 ncRNA 的 数量 分 布 与 玉 


米 (Zea mays) (WANG etal., 2016) 基本 相似 ,修正 了 之 前 分 书 
例 太 高 的 情况 。SMRT 全 长 转录 组 测序 数据 与 ncRNA 二 代 转 录 组 测序 数据 的 联合 分 析 ， 
效 地 提高 了 IncRNA 测序 数据 的 利用 效率 , 很 大 程度 上 弥补 了 以 近 缘 种 菠萝 基因 组 作为 参考 
基因 组 鉴定 ncRNA 所 带 来 的 缺陷 ， 鉴 定 得 到 的 IncRNA 数量 极 显著 提高 ， 丰 富 了 红 苞 凤梨 
IncRNA 数据 库 信 息 。 联 合 分 析 结 果 中 , 修正 了 4 种 IncRNA 数量 分 布 的 异常 ,提高 了 IncRNA 
鉴定 结果 的 准确 性 ,有效 地 提高 了 后 期 相关 研究 的 可 行 性 和 可 靠 性 。IncRNA 和 mRNA 序列 
结构 对 比分 析 表 明 ， 与 编码 基因 相 比 ，lncRNA 具有 表达 丰 度 较 低 、 序 列 长 度 较 短 ， 外 显 子 


结果 中 ，sense IncRNA Lt 
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BARD, ORF 长 度 较 短 等 结构 特点 。 这 与 斑马 鱼 (Brachydanio rerio) (im B, 2017) 、 


自 权 (Poncirus trifoliata) (WANG etal., 2017) . #4 (Populus) ( 田 净 净 ，2016) 的 分 
析 结 果 一 致 ， 说 明 IncRNA 的 这 些 结构 特征 在 生物 中 具有 普遍 性 。 

IncRNA 靶 基 因 的 预测 以 及 靶 基 因 的 功能 注释 和 富 集 分 析 ， 是 研究 IncRNA 功能 的 重要 
We GHB, 2019) 。 本 研究 中 ，GO M KEGG 的 联合 分 析 表 明 ， 在 所 研究 的 叶片 发 育 的 三 
个 阶段 中 ， 差 异 表 达 IncRNA 的 邯 基 因 注 释 到 了 叶片 生长 发 育 的 多 个 方面 ， 包 括 了 碳 代谢 、 
氨基 酸 代 谢 、 脂 代谢 、 核 糖 体 、 淀 粉 和 糖 代 谢 等 这 些 基 础 代谢 方面 ， 也 包括 了 植物 激素 信号 
转 导 等 调控 机 制 方面 。 在 未 展 叶 期 ， 差异 表达 ncRNA 的 靶 基因 注释 到 了 路 啉 和 叶绿素 代谢 
途径 , 说明 在 叶片 发 育 的 早期 , 全 绿 全 白 叶 片 的 叶绿素 合成 代谢 就 出 现 了 差异 ， 导致 了 叶片 
色 的 差异 。 在 4~5 叶 期 和 10~12 叶 期 ， 光 合作 用 途径 富 集 了 差异 表达 基因 ， 说 明 由 于 叶 
片 的 失 绿 白化 ， 光 合作 用 受到 抑制 ， 相 关 基 因 差 异 表达 。 同 时 ， 由 于 光合 作用 能 力 的 差异 ， 
全 绿 全 白 叶 片 在 各 个 生理 代谢 方面 都 表现 出 差异 ,在 很 多 基础 代谢 、 调 控 途 径 、 核 酸 代谢 等 
方面 都 富 集 了 差异 表达 基因 。 这 些 基 因 表 达 模 式 说 明 ，IncRNA 对 靶 基 因 表 达 的 调控 作用 可 
能 在 红 苞 凤梨 叶片 发 育 早 期 叶绿素 合成 代谢 差异 以 及 后 期 光合 作用 差异 和 其 他 生理 代谢 差 
异 方面 都 起 着 重要 的 调控 作用 。 本 研究 中 鉴定 出 的 相关 差异 表达 IncRNA 信息 ， 为 进一步 研 
究 IncRNA 对 部 基因 的 调控 作用 及 靶 基 因 在 红 奉 凤梨 叶片 失 绿 白化 突变 机 制 , 全 面 揭示 红 瘟 
凤梨 金边 蔡 合 体形 成 的 机 理 提 供 了 重要 的 数据 基础 。 
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